AI资讯新闻榜单内容搜索- DeepSeek

国产大模型杀疯了，MiniMax-M2.5即将开源！

这两天 AI 圈真的太热闹了，就在网传 DeepSeek 要更新支持 100 万 Token 上下文的新模型时，MiniMax 率先冲锋，更新了他们的新旗舰模型：MiniMax-M2.5。更有意思的是，国外网友这段时间对国内 AI 大模型的更新节奏格外关注，他们甚至把这种争先更新的现象称为：Happy Chinese new year！

来自主题: AI资讯

9706 点击 2026-02-12 18:07

决定了：过年攻略全都不过脑子，让AI去想

春节还没到，「过年的气氛」已经渗入科技圈每个人的毛孔。单说 AI 大模型这一块，刚刚发布的有 kimi 2.5 和 Step 3.5 Flash，即将发布的据说还有 DeepSeek V4，GPT-5.3、Claude Sonnet 5、Qwen 3.5，GLM-5，说不定一觉醒来，现有的技术就要被颠覆。

来自主题: AI技术研报

5487 点击 2026-02-12 15:32

领英、猎聘们「抓」不到的 AI 天才，这个团队想用 AI「追猎」

当 DeepSeek 和 OpenAI 的核心突破者越来越年轻，传统的简历筛选正在失效。一位前阿里达摩院的研究员，试图用 Agent 编织一张能捕捉「下一个 Ilya」的网。

来自主题: AI资讯

8096 点击 2026-01-20 17:23

DeepSeek连发两篇论文背后，原来藏着一场学术接力

2026 年 1 月过半，我们依然没有等来 DeepSeek V4，但它的模样已经愈发清晰。

来自主题: AI技术研报

10126 点击 2026-01-16 10:06

刚刚，DeepSeek 再发梁文锋署名新论文：Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models

今天凌晨，喜欢闷声做大事的 DeepSeek 再次发布重大技术成果，在其 GitHub 官方仓库开源了新论文与模块 Engram，论文题为 “Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models”，梁文锋再次出现在合著者名单中。

来自主题: AI资讯

10470 点击 2026-01-13 07:59

DeepSeek 还能这么玩? 我用它修仙、宫斗、末日求生，太上头了

前几天元旦，DeepSeek 又激发了「假期更新」 Buff，梁文锋署名新论文刷屏 AI 圈，就在大家都在等待 V4 的发布时，我发现有一群人早就在 DeepSeek 里找到了新乐子：自制「橙光游戏」。

来自主题: AI资讯

8663 点击 2026-01-11 10:04

体验英伟达 AI 个人超算「核弹」DGX Spark，能微调出 DeepSeek R2 吗

最近，APPSO 终于拿到了这台来自黄仁勋倾情推荐的个人超算，英伟达 DGX Spark；到手的第一感觉，就是「小而美」。这电脑也太小了，没有 Mac Studio 那般笨重，可能就和 Mac Mini 差不多大；然后是银色的亮和用来散热的金属丝网又让它有点不一样，是专属的硬核美感。

来自主题: AI资讯

7982 点击 2025-12-31 15:19

瞄准AI、图形顶端战场：摩尔线程上演国产GPU硬核实力路演

这就是摩尔线程最新 AI 计算卡 S5000，单卡跑满血 DeepSeek 大模型的成绩。

来自主题: AI资讯

7969 点击 2025-12-22 17:06

DeepSeek V3到V3.2的进化之路，一文看全

12 月 1 日，DeepSeek 一口气发布了两款新模型：DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。几天过去，热度依旧不减，解读其技术报告的博客也正在不断涌现。知名 AI 研究者和博主 Sebastian Raschka 发布这篇深度博客尤其值得一读，其详细梳理了 DeepSeek V3 到 V3.2 的进化历程。

来自主题: AI技术研报

8493 点击 2025-12-08 12:48

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

8102 点击 2025-11-30 09:30